Сайт Информационных Технологий

ПОСТРОЕНИЕ РЕШАЮЩЕЙ ФУНКЦИИ В ЗАДАЧЕ АНАЛИЗА СТРУКТУРИРОВАННЫХ ОБЪЕКТОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

В.Б. Бериков

Институт математики, Новосибирск

Abstract — In the present paper we address a problem of statistical analysis of objects having complex hierarchical structure. We shall presume that these objects may have random number of sub-objects of different types, possessing some properties, and that the results of measurements are expressed in the form of fuzzy sets. The problem will be as follows: to construct an optimal decision function (discriminate or regression model). The class of logical decision functions is suggested for the solution of the problem. The criterion of logical function optimality is also suggested.

В данной работе рассматривается задача построения решающей функции распознавания образов или регрессионного анализа для объектов, имеющих сложную иерархическую структуру, в условиях неопределенности или неточности в измерениях их характеристик. Указанная задача возникает, например, при компьютерном анализе археологических находок в древних погребальных памятниках [1]. Данные памятники характеризуются наличием большого числа предметов погребального инвентаря различного типа, причем типы этих предметов различаются в разных памятниках. Каждый из этих предметов описывается с помощью набора некоторых характеристик, значения которых часто невозможно точно измерить по причине древности этих предметов.

Задача статистического анализа в случае нечетких или неточных данных рассматривалась в работах [2,3] и др. Использованию логических решающих функций в случае нечетко описанных данных для задачи распознавания образов была посвящена работа [4]. В работе [5] было предложено использовать логические функции в задаче регрессионного анализа для структурированных объектов, имеющих однотипные подобъекты, в случае точно измеренных характеристик объектов и их подобъектов. Аналогичная постановка, для задачи кластер анализа, рассматривалась в [6]. В предлагаемом докладе предлагается использовать логические функции для случая иерархически структурированных объектов различных типов в условиях неточности задания их характеристик, для задачи распознавания образов и регрессионного анализа.

Пусть некоторая область исследований представляется множеством G - генеральной совокупностью объектов изучения. Пусть для описания свойств объекта как целого используется набор характеристик X1, ... , Xn,Y. Кроме того, пусть каждый объект может состоять из некоторых подобъектов различных типов T1,…,ТL. Каждому типу Тl взаимно однозначно соответствует набор характеристик Xl,1, ... , Xl,nl, с помощью которых описываются свойства подобъектов данного типа. Обозначим множество значений характеристики Xj через Dj, j=1,...,n, множество значений характеристики Y через DY, а множество значений характеристики Xl,j через Dl,j , l=1,...,L, j=1,...,nl. Будем полагать, что все характеристики – дискретные с упорядоченным или неупорядоченным множеством значений. В случае, когда некоторое свойство измеряется в количественной шкале, соответствующая характеристика получается разбиением интервала изменения свойства на подынтервалы.

Структуру произвольного объекта a будем задавать в виде дерева A, в котором корневой вершине V соответствует объект в совокупности его подобъектов. Вершине Vl первого яруса соответствует определенный тип Tl подобъектов, lI {1,...,L}, где L - число данных типов. Каждой вершине V второго яруса дерева A, смежной с вершиной Vl, где m=1,...,Nl , соответствует m-й экземпляр подобъекта a, относящийся к l-му типу.

Статическим назовем такой тип, подобъекты которого всегда присутствуют в каждом объекте из G .

Динамическим типом назовем такой тип, подобъекты которого могут как присутствовать, так и отсутствовать в объектах из G .

Без ограничения общности можно предположить, что первые по порядку типы T1,…,Td – динамические, а следующие типы Td+1,…,TL – статические.

В принципе, можно указать примеры задач, в которых подобъекты также имеют сложную структуру, то есть содержат свои подобъекты различных типов, эти подобъекты, в свою очередь, также содержат подобъекты и т.д. Однако в данной работе мы ограничимся рассматриваемым простейшим случаем задания структуры.

Рассмотрим также следующее ограничение. Будем полагать, что у каждого объекта могут присутствовать подобъекты не более чем одного динамического типа. Указателем типа назовем величину pI {0,1,...,d}, которая соответствует номеру данного динамического типа (p=0, если отсутствуют подобъекты какого-либо динамического типа). Будем полагать, что значение p зависит от x=X(a)=(X1(a),..., Xn(a)) : p=p(x). Пусть , U0,U1, ...,Ud – разбиение D, (все Ui непустые), причем , где Ui,jI Dj –подмножество соседних значений в случае Xj – упорядоченной, либо любое подмножество значений, если иначе. Тогда положим p(x)=i тогда и только тогда, когда xI Ui, i=0,1,..,L. Обозначим xl=(xl,1,...,xl,nl), =(xl,j), l=d+1,...L, j=1,...,nl;

, ,

D' =

Рассмотрим следующий пример задания структуры. Пусть G – множество погребальных сооружений на определенной территории. Рассмотрим набор характеристик, описывающих объекты из G : X1 – пол погребенного, X2 – возраст, Y – исторический интервал внутри эпохи; DY={поздний неолит, ранняя бронза}. В качестве подобъектов рассматриваются предметы погребального инвентаря, которые могут принадлежать, в частности, к следующим типам: T1 – вооружение, T2 – женские украшения, T3 – предметы культа. Подобъекты, скажем, типа T1 описываются характеристиками X1,1 – вид вооружения, X1,2 – материал изготовления и т.д. Можно считать, что типы T1 и T2 являются динамическими, а тип Т3 – статическим. Указатель типа задается следующим образом: r(x1,x2)=0, при x2=ребенок; r(x1,x2)=1, при x1=мужчина и x2? ребенок; r(x1,x2)=2, при x1=женщина и x2? ребенок.

Под основной задачей будем понимать построение модели влияния характеристик структурированного объекта на характеристику Y. В случае количественной Y это будет регрессионная модель, а в случае качественной характеристики – дискриминантная модель. Другими словами, требуется построить решающую функцию, которая позволяла бы по описанию произвольного объекта (включая его подобъекты) предсказать значение Y.

В процессе исследований наблюдатель формирует обучающую выборку объектов a= {a1,...,aN}, aiI G и одновременно путем проведения соответствующих измерений значений характеристик получает набор наблюдений (таблицу данных) d(a).

Будем полагать, что измерения характеризуются неточностью, связанной либо со свойствами самих объектов, либо с особенностями процесса измерения.

Обозначим через xji значение характеристики Xj, j=1,...,n, а через yiзначение характеристики Y для объекта ai,; через - значение характеристики Xl,j для m-го экземпляра объекта ai, имеющего тип Tl, где l=1,...,L, j=1,..,nl, m=1,...,Nl. Пусть ri=r(ai), i=1,...,N. Пусть в таблице d(a) указаны нечеткие множества значений переменных для объектов, а также для их подобъектов. Задание данных нечетких множеств проводится путем указания соответствующих функций принадлежности при xjI Dj, причем при ; при yI DY ; при xl,jI Dl,j , lI {1,...,L} (все m I [0,1]).

Введем понятие логической решающей функции. Рассмотрим набор a высказываний вида:

"Еcли(для r>0) и вида

(для r=0), где – разбиение Ur, – разбиение Dr , – разбиение соответственно на M, и непустых подобластей, причем все подобласти определяются аналогично U0,U1, ...,Ud декартовым произведением подмножеств значений характеристик, т.е.

, , r=0,1,...,L, t=1,...,M, q=1,..., (q=0 при r=0), v=1,..., . Пусть М' =M (“сложность” решающей функции).

Данный набор высказываний определяет некоторое отображение D' ® DY. Множество F всевозможных отображений, соответствующих разбиениям указанного вида и образует класс логических решающих функций. Критерий качества разбиения a определим по обучающей выборке так. Вычислим степень принадлежности каждого объекта ai , вместе с его подобъектами, к областям разбиения:

, где , (), , , , , , , , = (для l=r,d+1,…,L).

Положим =, , yI DY.

Пусть Y характеристика с неупорядоченным множеством значений (т.е. рассматривается задача дискриминантного анализа). Под критерием качества разбиения будем понимать величину

Q= .

Если Y характеристика с упорядоченным множеством значений (т.е. рассматривается задача регрессионного анализа), то под критерием качества разбиения будем понимать величину

Q=.

Оптимальной логической решающей функцией из класса F при фиксированных M,, будем считать такую функцию, для которой величина Q минимальна.

Поясним смысл приведенных выше формул. Степень принадлежности объекта подобластям разбиения возникает ввиду неточности измерений и наличия нескольких подобъектов различных типов (соответствующие этим подобъектам нечеткие множества объединяются). Величина интерпретируется как "вес" значения y для соответствующей подобласти. Величина Q является аналогом ошибки классификации (оценки дисперсии) на обучающей выборке.

При прогнозировании Y для нового объекта a вычисляются степени принадлежности к подобластям разбиения . Затем определяются величины , которые выступают как степени принадлежности для каждого значения Y.

Таким образом, исходная задача сводится к нахождению логической решающей функции заданной сложности, минимизирующей значение критерия качества Q. Для этой цели можно применять различные приближенные методы дискретного программирования, в частности, описанный в работе [7] алгоритм построения оптимальной логической решающей функции, имеющей вид дерева решений.

Работа поддержана грантом РФФИ № 98-01-00673.

Литература

  1. Деревянко Е.И., Лбов Г.С., Худяков Ю.С., Бериков В.Б. и др. Компьютерная система анализа данных погребальных памятников эпохи неолита и ранней бронзы. В сборнике: “Интеграционные программы фундаментальных исследований” – Новосибирск: СО РАН, 1998, с. 135 – 143.
  2. Борисов А.Н., Алексеев А.В. и др. Обработка нечеткой информации в системах принятия решений // М: Радио и связь, 1989. – 304 с.
  3. Kruse R., Meier K.D. Statistics with Vague Data // Theory and Decision Library. Series B, Mathematical and Statistical Methods. – Dordecht-Boston, 1987.
  4. Бериков В.Б., Викентьев А.А. Анализ неточной экологической информации в классе логических решающих функций. // Труды конференции "Математические проблемы экологии", ИМ СО РАН, Новосибирск, 1994, с.33-38.
  5. Старцева Н.Г., Людвина Н.А. Регрессионный анализ для структурированного объекта // Докл. РАН. 1996, Т.346. N.5. C. 600-603
  6. Ketterlin A., Gancarski P., Korczak J. Hierarchical Clustering of Composite Objects with a Variable Number of Components. In: “Learning from Data: AI and Statistics V. Edited by D. Fisher and H.-J. Lenz. Springer – Verlag, 1996. Pp. 229 – 238.
  7. Lbov G.S., Berikov V.B. Recursive Method of Formation of the Recognition Decision Rule in the Class of Logical Functions // Pattern Recognition and Image Analysis, Vol 3, N 4, 1993, pp.428-431.

Site of Information Technologies
Designed by  inftech@webservis.ru.